home *** CD-ROM | disk | FTP | other *** search
/ Shareware Overload Trio 2 / Shareware Overload Trio Volume 2 (Chestnut CD-ROM).ISO / dir39 / 2000tech.zip / 2204.TXT < prev    next >
Text File  |  1993-08-03  |  13KB  |  209 lines

  1. Document Number 2204
  2. Optical Character Recognition Technology Information
  3. May 1993
  4.  
  5. In the Beginning . . .
  6.  
  7. Although optical character recognition (OCR)  has only recently been 
  8. popularized, OCR, or at least the concept of OCR, has existed since the 
  9. beginning of the nineteenth century.  In 1809, the first patents for reading 
  10. devices to aid the blind were awarded.  These inventions were the first real 
  11. "seeds" of OCR's development.  
  12.  
  13. The next 100 years saw numerous advances in optical scanning. One important 
  14. invention was the "retina scanner" that used a mosaic of photocells in an 
  15. image transmission system.  Another important milestone in the evolution of 
  16. OCR was the invention of the "Nipkow Disk," a sequential scanning disk which 
  17. made possible the technique of line-by-line analysis of images, as well as 
  18. other future innovations. For example, the principle of Nipkow's sequential 
  19. scanning process was used in the operation of modern television cameras and as 
  20. a technology incorporated in many current OCR systems.  
  21.  
  22. Shortly before World War I, the first true "readers," or machines that were 
  23. able to convert printed characters into another form, were made commercially 
  24. available.   In 1912, Emmanuel Goldberg patented a machine which directly read
  25. characters and converted those symbols into standard telegraph code.  
  26. Goldberg's machine read typed messages, converted  them to paper tape, and 
  27. then used the tape to transmit telegraphic messages over wires without human 
  28. intervention.  His invention demonstrated a practical application of OCR.  
  29. During the same time, but independently, Fournier D'Albe invented an OCR 
  30. device called the "Optophone."  The Optophone was a hand-held scanner that 
  31. optically scanned printed material and produced series of audible tones while 
  32. being moved along a page.  Each tone corresponded to a specific letter or 
  33. character which allowed a visually impaired person to interpret written 
  34. material.  In the late 1920's, AT&T patented systems which scanned messages 
  35. and encoded them into "Morse Code" for telegraphic transmission.   
  36.  
  37. Emmanuel Goldberg was responsible for yet another significant development in 
  38. 1931, when he patented a device that searched photographic transparencies of 
  39. data records and attempted to match them against a template of the desired 
  40. search pattern. The hypothesis behind this system was that once a match was
  41. located, the coincidence of pattern would cause a light source to be 
  42. completely blocked from a detection device, more specifically, a photographic 
  43. cell.  This concept was the beginning concept of "template matching."  This 
  44. technique was actually applied in the first actual working character readers
  45. which appeared in the 1950's.  
  46.  
  47. In the mid 1940's, the birth of the electronic data processing industry 
  48. created the need for a productive method of data entry.  Although IBM entered 
  49. the optical scanning field in 1938, and was awarded various OCR-related 
  50. patents, including one for a "Light Sensitive Device," the computer pioneer 
  51. made no attempts to market commercial OCR devices until after 1960.
  52.  
  53. A nonscientific article in the mid 1950's introduced to the public the first 
  54. potential commercial marketplace for OCR technology and equipment -- an 
  55. invention named "Gismo."  Developed by a Department of Defense engineer, Gismo 
  56. was capable of reading of reading 23 letters of the alphabet, which had been
  57. produced by a standard typewriter.  Gismo could also understand Morse Code, 
  58. read musical notations, and even read aloud from printed pages.  The inventor 
  59. was quoted as saying that once "Gismo" got into production, the machine would 
  60. have about 99.9-percent reading accuracy and would sell for approximately 
  61. $1000.00.  Of course, this was all theory in 1950.  But it generated 
  62. substantial enthusiasm and pointed to a bright future for OCR.
  63.  
  64. Shortly after "Gismo" captured the public's attention, the same engineer 
  65. founded Intelligent Machines Research Corporation (IMR).  IMR developed and 
  66. applied OCR technology to the problems and needs of commercial data 
  67. processing.  The company went on to achieve a major first in OCR with the 
  68. installation of a commercial OCR reader at Reader's Digest in New York in 
  69. 1954. The initial reader was used to convert typewritten documents (sales 
  70. reports) into punched cards for input into the subscription department 
  71. computer.  This equipment enabled the magazine to reduce order processing from 
  72. the former rate of one month to a little more than a day.  Reader's Digest 
  73. scanner, often cited as "paying for itself" twice each year, had already read 
  74. its billionth character by September of 1959.  
  75.  
  76. Numerous other companies were early adopters of OCR:  First National City 
  77. Bank, New York (processing travelers' checks); National Biscuit Company 
  78. (converting sales records to cards); AT&T (dividend checks and stockholder 
  79. records); Ohio Bell Telephone; Arizona Public Service Company; Atlantic City
  80. Electric (cash accounting) and numerous government agencies including the U.S. 
  81. Post Office.  At this time, most of the OCR systems were hardware + software 
  82. combined devices costing hundreds of thousands of dollars that were restricted 
  83. to reading two specialized fonts: OCR A and OCR B.
  84.  
  85. "Matrix matching" dominated OCR technology during the 1970's. In matrix 
  86. matching systems, the software compares small parts of each bit-image scanned 
  87. to bit-patterns stored in a library, finding which stored character is the 
  88. most similar to the bit-pattern scanned.  However, the large variety of fonts, 
  89. type sizes, and styles created a major problem for matrix matching.  For 
  90. example, an Italic "A" has a different pattern from a Roman "A," even within 
  91. the same size and type family.  Because of this, a matrix-matching OCR system 
  92. must have either an enormous library of bit-patterns, (which requires a time-
  93. consuming search for each match), or the system must be limited to matching a 
  94. few type styles.
  95.  
  96. Matrix matching systems are commonly referred to as "trainable," since they 
  97. allow the user to "train" the program to recognize different fonts.  
  98. Generally, after a document has been scanned, the program separates out what 
  99. it believes to be character images and asks the user to identify each image.  
  100. It then stores each bitmap as the assigned character in its library and 
  101. matches later images against that collection of bitmaps in order to identify 
  102. characters.  This process is very time-consuming, given the number of fonts 
  103. available today.
  104.  
  105. In 1974, a company named Kurzweil was formed to extend the capabilities of OCR
  106. to fonts other than the set fonts.  The company's initial goal was to enable 
  107. blind people to hear written documents through OCR software and voice 
  108. synthesis.  A new technology was sorely needed, since matrix matching was 
  109. becoming increasingly difficult, as word processors and laser printers gave 
  110. rise to a rapid proliferation of fonts and heavily kerned, touching text. The 
  111. technology pioneered by Kurzweil for the blind was called "OmniFont."
  112.  
  113. OmniFont, also known as "feature extraction," looks at the features of a 
  114. character to recognize it, instead of looking at the entire letter and 
  115. matching it to a letter in its library. The features each character are 
  116. matched to the features of a known character.  For example, a figure charac-
  117. terized by two slanted lines with a horizontal line across the center is an 
  118. "A."  A vertical line with a circle attached on the lower right hand side is 
  119. a "b."  If the circle is on the other side, it is a "d."  OmniFont works on 
  120. most normal fonts because most fonts, as different as they are, share the same 
  121. features.  
  122.  
  123. The major benefits of OmniFont over matrix matching are speed and the ability 
  124. to read most normal fonts.  The increase in speed is the result of minimizing 
  125. the samples table in relation to the volume of fonts supported.  A matrix 
  126. matching table can include multiple samples of each character and can be 
  127. updated by the user training it.  OmniFont only uses a table of generic 
  128. features which does not increase in size and makes the search process much 
  129. quicker.
  130.  
  131. In 1976, DEST pioneered an OCR solution to the business and office market, and 
  132. in 1980, introduced a product call the Workless Station.  The company claimed 
  133. that the Workless station garnered 65% of the flatbed scanner market.  
  134. However, the product was specialized and not for the mass commercial market.
  135.  
  136. In 1988, Caere brought OCR to the mass commercial market with the OmniPage 
  137. product -- an OmniFont OCR package aimed at the rapidly expanding flatbed 
  138. scanner market.  What had cost many thousands of dollars and ran only on 
  139. expensive hardware, was now offered to owners of personal computers with 
  140. flatbed scanners.
  141.  
  142. OCR on Every Desktop
  143.  
  144. Scanners -- the electronic "partner" of OCR -- give "eyes" to the computer by 
  145. providing a bridge between the analog world of everyday reality and the 
  146. digital world of the computer.  But before Caere revolutionized the scanner 
  147. market with the introduction of OmniFont technology, flatbed scanners were 
  148. seen as devices for capturing images, not text.  Today, scanners are seen as 
  149. both graphics and text solutions.
  150.  
  151. Until recently, quality images could only be captured and digitized with 
  152. extremely expensive flatbed and sheetfed scanners.  However, the same 
  153. functionality and sophistication are now available in the smaller, more 
  154. affordable hand-held scanner.  As a result, hand-held scanners have evolved 
  155. from tech toy of computer hobbyist into integral, productive desktop tools for 
  156. business people as well as the home user. 
  157.  
  158. As this evolution takes place, users are demanding capabilities beyond image 
  159. capture, as they purchase hand-held scanners to create complex documents that 
  160. incorporate both text and graphics.  Flatbed scanners are already able to 
  161. perform optical character recognition (OCR) at high level of speed and 
  162. accuracy; the challenge lies in bringing this capability to the hand-held 
  163. scanner.  
  164.  
  165. In 1988, Logitech introduced the first ScanMan hand-held scanner and brought 
  166. scanning to the individual desktop.  The unit was intended for graphics 
  167. scanning and limited to 200 dpi hardware resolution.  In addition, it was 
  168. difficult to scan straight with this early model, which contained only one 
  169. set of rollers. Thus, OCR was not a recommended use for the scanner.  What's
  170. more, initial OCR packages for hand-held scanners were expensive and, in many 
  171. cases, too slow and inaccurate to truly enhance individual productivity. 
  172.  
  173. ScanMan Plus for DOS, introduced by Logitech in late 1989, paved the way for 
  174. OCR in the hand-held environment.  With its 400 dpi hardware resolution, 
  175. extra set of rollers, scanning speed indicator, straightedge head design, and 
  176. scanning speed indicator, ScanMan Plus enabled users to control their scans 
  177. and achieve a level of resolution necessary for OCR.  
  178.  
  179. The first version of CatchWord, a DOS-based OCR software by Logitech, followed
  180. the introduction of ScanMan Plus.  CatchWord marked the second stage in the 
  181. evolution of Logitech hand-held scanners into highly functional, multipurpose 
  182. input devices. CatchWord used OmniFont technology, giving hand-held scanners
  183. the flexibility to capture a wide range of fonts and styles. CatchWord was 
  184. also able to scan full pages of text by stitching together two scans of a 
  185. full page.
  186.  
  187. In 1992, Logitech introduced CatchWord Pro for Windows. CatchWord Pro for 
  188. Windows represented a new generation of OCR software that kept the special 
  189. requirements of hand-held scanners in mind.
  190.  
  191. Logitech is now directly partnering with the acknowledged market leader in OCR 
  192. software for the personal computer and the founder of OmniFont technology -- 
  193. Los Gatos, Calif.-based Caere Corporation.  Caere is tailoring its popular 
  194. OmniFont Direct product for use with Logitech's Windows-based ScanMan hand-
  195. held scanners.  The application -- OmniPage Direct for Logitech -- is 
  196. positioned as an affordable basic utility designed to meet the needs of 
  197. ScanMan users who wish to capture a few pages of text to incorporate into 
  198. other documents.
  199.  
  200. Acknowledgment
  201.  
  202. Much of the history of OCR was obtained with permission from the book The 
  203. History of OCR by Herbert Schantz.  Herbert Schantz is the Director and Vice 
  204. President of the Recognition Technology Users Group and a member of the 
  205. OCR/Scanner/Fax Association.  He has written many papers and given numerous 
  206. presentations on the theory, economics, and application of OCR dating back to 
  207. 1969.  Logitech would like to thank him for writing such an exciting and 
  208. informative book on a subject that does not have that much written about it.
  209.